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Capitulo 2 


sQué es el almacenamiento 
definido por software? 


En este capitulo 
Como armar las piezas del almacenamiento definido por software 
Reconociendo los beneficios del almacenamiento definido por software 


Introduccion del almacenamiento definido por software GPFS 


FE almacenamiento definido por software es un concepto relativa- 
mente nuevo en la industria de computacion y el almacenamiento, 
y puede referirse a distintas tecnologias e implementaciones. Forma 
parte de una tendencia de industria mas amplia que incluye las redes 
definidas por software (software defined networking / SDN) y los centros 
de datos definidos por software (software defined data centers | SDDC). 
Este capitulo explica exactamente de qué se trata el almacenamiento 
definido por software. 


Definiendo el almacenamiento 
definido por software 


En su nivel mas basico, software defined storage o 
almacenamiento definido por software es almacenamiento de clase 
empresarial que utiliza hardware estandar, con todas las funciones 
importantes de almacenamiento y gestion realizadas dentro de un 
software inteligente. El almacenamiento definido por software 
ofrece servicios de almacenamiento automatizados, basados en 
politicas y con conciencia de aplicaciones, a través de la 
orquestacion de la infraestructura de almacenamiento subyacente, 
con soporte para un entorno general definido por software. El 
hardware estandar incluye: 


18 





Almacenamiento definido por software para Dummies 


 Almacenamiento en disco, como SAN, NAS y disk arrays 0 JBOs 
(conjunto de discos, o "just a bunch of disks") 


 Dispositivos de red, como switches e interfaces de red 


¥ Servidores para procesamiento, administracion y gestion del 
almacenamiento 


Caracteristicas adicionales que el almacenamiento definido 
por software puede incluir: 


 Administracion automatizada, basada en politicas para 
funciones de gestion, tales como gestidn del ciclo de vida de 
la informacion (ILM) y aprovisionamiento 


 Virtualizacién del almacenamiento 


¥ Planos separados de control y datos para administrar la 
infraestructura de almacenamiento y los datos en la 
infraestructura de almacenamiento, respectivamente 


 Arquitectura con escalabilidad scale-out masiva 


Estas caracteristicas se diferencian de los sistemas de almacenamiento 
tradicionales que dependen fuertemente de controladores basados en 
hardware personalizados para realizar funciones de almacenamiento. 
Los sistemas NAS, DAS y SAN (que se comentan en el Capitulo 1) 
son ejemplos de sistemas de almacenamiento tipicos basados en 
hardware que utilizan controladores RAID especiales y firmware 
personalizado no portable para desempejiar sus funciones de 
almacenamiento. 


Beneficios clave del 
almacenamiento definido por 
software 


Las empresas hoy reconocen muchos beneficios significativos en el 
almacenamiento definido por software en sus centros de datos. Entre 
otros: mayor flexibilidad, gestién automatizada, eficiencia de costos y 
escalabilidad sin limites. 


Mayor flexibilidad y agilidad 


Las plataformas de almacenamiento empresarial tradicionales, tales como 
SAN y NAS (comentadas en el Capitulo 1) en general se basan sobre 
sistemas propietarios y vienen con un alto costo total de propiedad (TCO). 
Las soluciones SAN suelen requerir el uso de switches SAN costosos y 
complejos, conjuntos de almacenamiento y otros componentes propietarios. 


L STy, 
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Los dispositivos NAS son relativamente baratos pero tienen una 
escalabilidad limitada. Cuando uno se queda sin espacio en un 
dispositivo NAS, simplemente comienza a agregar mas. Sin embargo, 
no se trata de una verdadera capacidad scale-out porque cada NAS 
individual se presenta como un almacenamiento separado e individual 
que se maneja aparte. 

Una solucion de almacenamiento definido por software aumenta la 
flexibilidad, al permitir a las organizaciones utilizar hardware estandar no 
propietario y, en muchos casos, aprovechar la infraestructura de 
almacenamiento existente como parte de su solucién de almacenamiento 
empresarial. Ademas, las organizaciones pueden lograr una escala masiva 
con una solucién de almacenamiento definido por software, sumando 
componentes de hardware heterogéneos e individuales segtin sea 
necesario, para aumentar la capacidad, y mejorar el rendimiento de la 
solucién. 


Uso inteligente de recursos y 
gestion automatizada 


La gestion automatizada y sobre la base de politicas que ofrecen las 
soluciones de almacenamiento definidas por software ayudan a impulsar 
las eficiencias operativas y de costos. Por ejemplo, el almacenameinto 
definido por software maneja funciones de almacenamiento importantes, 
como ILM, caché de disco, snapshots, replicacién, striping y clustering. En 
suma, estas capacidades del almacenamiento definido por software le 
permiten poner los datos correctos en el lugar correcto, en el momento 
correcto y con el rendimiento y el costo correcto, automaticamente. 


Eficiencia de costos 


En lugar de usar un costoso hardware propietario, el almacenamiento 
definido por software utiliza hardware estandar para reducir sustancialmente 
tanto los costos de adquisici6n como el costo total de propiedad (TCO) para 
una solucion de almacenamiento de clase empresarial. El software en una 
solucion de almacenamiento definida por software se basa sobre estandares y 
administra la infraestructura de almacenamiento, asi como los datos dentro 
del sistema de almacenamiento. 

En muchos casos, las organizaciones pueden aprovechar sus inversiones 
actuales en infraestructura de almacenamiento, redes y servidores para 
implementar una solucién de almacenamiento definida por software que 
es sumamente eficiente en funcidn de costos. 


DATOS TECNICOS: En un informe de julio 2012, Gartner, Inc. revelé que el 
costo de adquisicion promedio por gigabyte de los sistemas de 
almacenamiento tradicionales multi-tier estaba en el rango de $0,9/GB a $ 5/ 
GB. En comparacion, las soluciones de almacenamiento definido por 
software promedian $0,4/GB. 
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Escala de datos elastica sin limites 


A diferencia de los sistemas tradicionales de almacenamiento, como SAN 
y NAS, el almacenamiento definido por software le permite aumentar la 
escala (scale out) con hardware estandar relativamente barato, en tanto 
que puede seguir administrando el almacenamiento como un unico 
sistema de clase empresarial. Al aumentar la escala de la infraestructura 
de almacenamiento, el rendimiento y la rentabilidad siguen mejorando. 
Por ejemplo, IBM General Parallel File System (GPFS) ofrece 
mejoras de érdenes de magnitud en rendimiento I/O a medida que se 
agrega hardware, en comparacion con NAS convencional (Figura 2-1). 
GPFS es el tema de un andlisis mas detallado en el Capitulo 3. 





Rendimiento |/0 
medido 


IBM GPFS 


INNS rere nViclatel (ey avs] 


Figura 2-1: IBM GPFS ofrece rendimiento I/O extremo. 


El almacenamiento definido por software ofrece escalabilidad 
masiva y casi ilimitada. Por ej emplo, IBM GPFS da soporte a: 


“ tamano de sistema de archivos maximo: un millon de 
yottabytes 


2% (o aprox. 9 trillones) de archivos por sistema de archivos 
4 IPv6 


1a 16.384 nodos en un cluster 


Un yottabyte equivale a un billén de terabytes. 
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Soporte para archivos, 
bloques y objetos 


g MBER 


El almacenamiento definido por software en general se refiere a software 
que maneja la creacién, colocacién, proteccién y recuperacion de datos. 
IBM GPFS es una solucién de almacenamiento definido por software de 
clase empresarial que se ejecuta sobre plataformas IBM y de terceros y que 
esta disponible como software que puede implementarse sobre una 
variedad de sistemas de hardware commodity y como parte de un 
"appliance" integrado, el GPFS Storage Server (GSS), que se describe 
en el Capitulo 4. 

Los desarrolladores de grandes aplicaciones a escala Cloud han 
expresado un interés particular en el almacenamiento definido por 
software. Para ellos, las pesadas soluciones existentes controladas por 
hardware simplemente no ofrecen escalabilidad, tienen costos 
prohibitivos y son demasiado inflexibles para aumentar la capacidad 
en forma dinamica para los datos de aplicaciones necesarias para 
responder a sus necesidades de negocio en el futuro. Muchos de ellos 
han enfocado su desarrollo en OpenStack, la plataforma de 
computacion de nube de fuente abierta para nubes publicas y 
privadas. En el recuadro "Foco en OpenStack" se presenta 
informacion mas detallada. 

RECUERDE: Para desarrolladores OpenStack, GPFS puede unificar el 
almacenamiento con una forma comun de almacenar imagenes VM, 
dispositivos de bloque, objetos y archivos. El almacenamiento definido 
por software permite este tipo de integracién. GPFS funciona como 
GPFS Native RAID (GNR) y la colocacién de datos sobre la base de 
politicas le ofrece la flexibilidad de poner los datos en la mejor 
ubicacion en el mejor nivel (tier) (en cuanto a rendimiento y costo), en 
el momento correcto. El almacenamiento definido por software permite 
la implementacién sobre hardware estandar de industria heterogéneo, 
como se muestra en la Figura 2-2. 
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Figura 2-2: GPFS ofece u n plano de almacenamiento comun. 
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Foco en OpenStack 


OpenStack tiene una arquitectura 
modular con diversos componentes, 


entre otros: 


 OpenStack Compute (Nova): 
Un controlador de cloud 
computing fabric 


Block Storage (Cinder): Ofrece 
dispositivos de almacenamiento 
de nivel de bloque persistentes 


YY Object Storage (Swift): sistema 
de almacenamiento redundante 
escalable 


Con OpenStack, usted puede controlar 
pools de recursos de procesamiento, 
almacenamiento y redes en todo un 
centro de datos. Y aunque OpenStack 
ofrece versiones de fuente abierta de 
almacenamiento de bloques y objetos, 
muchos desarrolladores OpenStack 
identificaron la necesidad de 
almacenamiento mas robusto para 
respaldar aplicaciones a escala Cloud. Si 
bien muchos desarrolladores OpenStack 
sienten que pueden disefar la 
arquitectura para evitar las limitaciones 
de capacidades de cémputo y robustez de 
OpenStack, el almacenamiento tiene un 
"estandar mucho mas alto" en cuanto a 
resiliencia y confiabilidad. 

Respondiendo a la necesidad de un 
robusto almacenamiento definido por 
software, el release OpenStack “Havana” 
incluye un driver OpenStack Block Storage 
Cinder para IBM GPFS, que proporciona a 
los arquitectos que construyen nubes 
publicas, privadas e hibridas acceso a las 
caracteristicas y capacidades del sistema de 
almacenamiento definido por software 
lider de la industria para el segmento 
empresarial. Y Cinder es tan sdlo el 
comienzo. 


La vision que tiene IBM para GPFS y 


OpenStack es crear un unico plano scale- 
out para todo el centro de datos o para 
multiples centros de datos conectados en 
el mundo. 


GPFS unifica imagenes, dispositivos de 
bloque, objetos y archivos OpenStack VM 
con soporte para Nova, Cinder, Swift y 
Glance, junto con interfaces POSIX como 
NFS y CIFS para integrar aplicaciones 
legacy. La capacidad de usar un unico 
sistema de archivos GPFS para manejar 
volumenes (Cinder), imagenes (Glance), 
sistemas de archivos compartidos 
(Manila), y usar clones de archivos para 
compartir datos con eficiencia y rapidez 
dentro y entre componentes sera una 
gran ventaja para desarrolladores de 
aplicaciones a escala Cloud que 
utilizan OpenStack. 


La robustez y las caracteristicas de 
GPFS combinadas con extensiones 
de objetos OpenStack Swift pueden 
proporcionar un almacenamiento 
extenso de objetos de grado 
empresarial con alta eficiencia de 
almacenamiento, integracién de 
cinta, replicacién de area amplia, 
tiering transparente, checksums, snapshots 
y ACLs: capacidades que la mayoria de las 
ofertas de almacenamiento basado en 
objetos hoy no pueden igular. OpenStack 
sobre GPFS ofrece eficiencias atractivas en 
una unica solucién de almacenamiento 
unificada que puede dar soporte a objetos y 
acceso a archivos a los mismos datos con 
proteccion de datos GPSF Native RAID. El 
almacenamiento de objetivos OpenStack 
Swift en GPFS puede reducir la 
cantidad de almacenamiento bruto 
que se necesita usar, en comparacién 
con sistemas de almacenamiento de 
objetos que dependen estrictamente 
de la replicacién. 








